智能论文笔记

Type-aware Embeddings for Multi-Hop Reasoning over Knowledge Graphs

Zhiwei Hu , Víctor Gutiérrez-Basulto , Zhiliang Xiang , Xiaoli Li , Ru Li , Jeff Z. Pan

分类：人工智能 | 机器学习

2022-05-02

关于现实生活知识图（KGS）的多跳上推理是一个高度挑战的问题，因为传统的子图匹配方法无法处理噪音和缺失信息。为了解决这个问题，最近已经引入了一种有希望的方法，该方法基于将逻辑查询和kgs共同嵌入到一个低维空间中以识别答案实体。但是，现有的提案忽略了KGS中固有可用的关键语义知识，例如类型信息。为了利用类型信息，我们提出了一种新颖的类型感知消息传递（TEMP）模型，该模型可以增强查询中的实体和关系表示形式，并同时改善概括，演绎和归纳推理。值得注意的是，Temp是一种插件模型，可以轻松地将其纳入现有的基于嵌入的模型中以提高其性能。在三个现实世界数据集上进行了广泛的实验证明了温度的有效性。

translated by 谷歌翻译

Learning Logic Rules for Document-level Relation Extraction

Dongyu Ru , Changzhi Sun , Jiangtao Feng , Lin Qiu , Hao Zhou , Weinan Zhang , Yong Yu , Lei Li

分类：自然语言处理

2021-11-09

文件级关系提取旨在识别整个文件中实体之间的关系。捕获远程依赖性的努力大量依赖于通过（图）神经网络学习的隐式强大的表示，这使得模型不太透明。为了解决这一挑战，在本文中，我们通过学习逻辑规则提出了一种新的文档级关系提取的概率模型。 Logire将逻辑规则视为潜在变量，包括两个模块：规则生成器和关系提取器。规则生成器是生成可能导致最终预测的逻辑规则，并且关系提取器基于所生成的逻辑规则输出最终预测。可以通过期望最大化（EM）算法有效地优化这两个模块。通过将逻辑规则引入神经网络，Logire可以明确地捕获远程依赖项，并享受更好的解释。经验结果表明，Logire在关系性能（1.8 F1得分）和逻辑一致性（超过3.3逻辑得分）方面显着优于几种强大的基线。我们的代码可以在https://github.com/rudongyu/logire提供。

translated by 谷歌翻译

Deep DIC: Deep Learning-Based Digital Image Correlation for End-to-End Displacement and Strain Measurement

Ru Yang , Yang Li , Danielle Zeng , Ping Guo

分类：计算机视觉

2021-10-26

数字图像相关性（DIC）已成为一种行业标准，以检索拉伸试验和其他材料表征中的精确位移和应变测量。虽然传统的DIC为一般拉伸检测情况提供了高精度估计，但是在大变形或斑点图案开始撕裂时，预测变得不稳定。此外，传统的DIC需要长的计算时间，并且通常会产生受滤波和散斑图案质量影响的低空间分辨率输出。为了解决这些挑战，我们提出了一种新的深度学习的DIC方法 - 深层DIC，其中两个卷积神经网络，偏移和拉力纳特，旨在共同努力，以实现位移和菌株的端到端预测。 displacementNet预测位移字段并自适应地跟踪感兴趣的区域。 RATEDNET直接从图像输入预测应变场，而不依赖于位移预测，这显着提高了应变预测精度。开发了一种新的数据集生成方法以综合现实和全面的数据集，包括产生散斑图案和具有合成位移场的斑点图像的变形。虽然仅接受了合成数据集的培训，但深度DIC提供了从商业DIC软件获得的真实实验中获得的那些对位移和应变的高度一致和可比的预测，而即使在大型和局部变形和变化的变形和变化的模式质量和变化的模式质量方面，它占商业软件。。此外，深DIC能够实时预测变形，并将计算时间降至毫秒。

translated by 谷歌翻译

NTIRE 2021 Challenge on Quality Enhancement of Compressed Video: Methods and Results

Ren Yang , Radu Timofte , Jing Liu , Yi Xu , Xinjian Zhang , Minyi Zhao , Shuigeng Zhou , Kelvin C. K. Chan , Shangchen Zhou , Xiangyu Xu

分类：计算机视觉

2021-04-21

本文回顾了关于压缩视频质量增强质量的第一个NTIRE挑战，重点是拟议的方法和结果。在此挑战中，采用了新的大型不同视频（LDV）数据集。挑战有三个曲目。Track 1和2的目标是增强HEVC在固定QP上压缩的视频，而Track 3旨在增强X265压缩的视频，以固定的位速率压缩。此外，轨道1和3的质量提高了提高保真度（PSNR）的目标，以及提高感知质量的2个目标。这三个曲目完全吸引了482个注册。在测试阶段，分别提交了12个团队，8支球队和11支球队，分别提交了轨道1、2和3的最终结果。拟议的方法和解决方案衡量视频质量增强的最先进。挑战的首页：https：//github.com/renyang-home/ntire21_venh

translated by 谷歌翻译

UPHDR-GAN: Generative Adversarial Network for High Dynamic Range Imaging with Unpaired Data

Ru Li , Chuan Wang , Jue Wang , Guanghui Liu , Heng-Yu Zhang , Bing Zeng , Shuaicheng Liu

分类：计算机视觉

2021-02-03

本文提出了一种有效融合多暴露输入并使用未配对数据集生成高质量的高动态范围（HDR）图像的方法。基于深度学习的HDR图像生成方法在很大程度上依赖于配对的数据集。地面真相图像在生成合理的HDR图像中起着领导作用。没有地面真理的数据集很难应用于训练深层神经网络。最近，在没有配对示例的情况下，生成对抗网络（GAN）证明了它们将图像从源域X转换为目标域y的潜力。在本文中，我们提出了一个基于GAN的网络，用于解决此类问题，同时产生愉快的HDR结果，名为Uphdr-Gan。提出的方法放松了配对数据集的约束，并了解了从LDR域到HDR域的映射。尽管丢失了这些对数据，但UPHDR-GAN可以借助修改后的GAN丢失，改进的歧视器网络和有用的初始化阶段正确处理由移动对象或未对准引起的幽灵伪像。所提出的方法保留了重要区域的细节并提高了总图像感知质量。与代表性方法的定性和定量比较证明了拟议的UPHDR-GAN的优越性。

translated by 谷歌翻译

JigsawGAN: Auxiliary Learning for Solving Jigsaw Puzzles with Generative Adversarial Networks

Ru Li , Shuaicheng Liu , Guangfu Wang , Guanghui Liu , Bing Zeng

分类：计算机视觉

2021-01-19

本文提出了一种基于生成的对抗网络（GAN）的解决方案，用于求解拼图游戏。问题假定图像被分成相等的方块，并要求根据碎片提供的信息恢复图像。传统的拼图拼写求解器通常根据拼写的边界确定关系，这忽略了重要的语义信息。在本文中，我们提出了一种基于GaN的辅助学习方法，用于用未配对的图像求解拼图拼图的GaN的辅助学习方法（没有初始图像的先验知识）。我们设计了一个多任务管道，包括（1）分类分支来对拼图排列，并且（2）GaN分支以正确的顺序恢复图像的图像。分类分支由根据洗片件产生的伪标签约束。 GaN分支专注于图像语义信息，其中发电机产生自然图像以欺骗鉴别器，而判别器区分给定图像是否属于合成或真实目标域。这两个分支通过流动的扭曲模块连接，该模块应用于扭曲特征以根据分类结果校正订单。所提出的方法可以通过同时利用语义信息和边界信息来更有效地解决拼图难题。针对几个代表性拼图求解器的定性和定量比较证明了我们方法的优越性。

translated by 谷歌翻译

CircuitNet: An Open-Source Dataset for Machine Learning Applications in Electronic Design Automation (EDA)

Zhuomin Chai , Yuxiang Zhao , Yibo Lin , Wei Liu , Runsheng Wang , Ru Huang

分类：机器学习

2022-08-01

电子设计自动化（EDA）社区一直在积极探索非常大规模的计算机辅助设计（VLSI CAD）的机器学习。许多研究探索了基于学习的技术，用于设计流中的跨阶段预测任务，以实现更快的设计收敛。尽管建筑机器学习（ML）模型通常需要大量数据，但由于缺乏大型公共数据集，大多数研究只能生成小型内部数据集进行验证。在本文中，我们介绍了第一个用于机器学习任务的开源数据集，称为CircuitNet。该数据集由基于6种开源RISC-V设计的商业设计工具的多功能运行中提取的10K以上样品组成。

translated by 谷歌翻译

Bayesian Generational Population-Based Training

Xingchen Wan , Cong Lu , Jack Parker-Holder , Philip J. Ball , Vu Nguyen , Binxin Ru , Michael A. Osborne

分类：机器学习 | 人工智能

2022-07-19

强化学习（RL）为可以在现实世界中自主互动的培训代理提供了潜力。但是，一个关键限制是RL算法对核心超参数和网络体系结构选择的脆弱性。此外，诸如不断发展的训练数据和增加的代理复杂性等非平稳性意味着不同的超参数和体系结构在不同的训练点上可能是最佳的。这激发了Autorl，这是一种试图自动化这些设计选择的方法。一类突出的Autorl方法是基于人群的培训（PBT），这在几个大型设置中导致了令人印象深刻的表现。在本文中，我们介绍了PBT式方法中的两项新创新。首先，我们采用基于信任区域的贝叶斯优化，从而可以全面覆盖高维混合参数搜索空间。其次，我们表明，使用世代相传，我们还可以在一次训练中共同学习体系结构和超参数。利用新的高度可行的Brax物理引擎，我们表明这些创新导致了巨大的性能增长，在即时学习整个配置的同时，大大优于调谐基线。代码可在https://github.com/xingchenwan/bgpbt上找到。

translated by 谷歌翻译

GUIM -- General User and Item Embedding with Mixture of Representation in E-commerce

Chao Yang , Ru He , Fangquan Lin , Suoyuan Song , Jingqiao Zhang , Cheng Yang

分类：人工智能

2022-07-02

我们的目标是为阿里巴巴业务的每个用户和每个产品项目建立一般代表性（嵌入），包括淘宝和Tmall，这是世界上最大的电子商务网站之一。用户和项目的代表性在各种下游应用程序中发挥着关键作用，包括建议系统，搜索，营销，需求预测等。受到自然语言处理（NLP）域中的BERT模型的启发，我们提出了GUIM（与代表的混合物混合在一起）的GUIM（一般用户项目），以实现大量，结构化的多模式数据，包括数亿美元的相互作用用户和项目。我们利用表示（MOR）的混合物作为一种新颖的表示形式来建模每个用户的各种兴趣。此外，我们使用对比度学习中的Infonce，以避免由于众多词汇的大小（令牌）词汇大小，因此避免了棘手的计算成本。最后，我们建议一组代表性的下游任务作为标准基准，以评估学到的用户和/或项目嵌入的质量，类似于NLP域中的胶合基准。我们在这些下游任务中的实验结果清楚地表明了从GUIM模型中学到的嵌入的比较价值。

translated by 谷歌翻译

Learning Affinity from Attention: End-to-End Weakly-Supervised Semantic Segmentation with Transformers

Lixiang Ru , Yibing Zhan , Baosheng Yu , Bo Du

分类：计算机视觉

2022-03-05

带有图像级标签的弱监督语义分割（WSSS）是一项重要且具有挑战性的任务。由于高训练效率，WSS的端到端解决方案受到了社区的越来越多的关注。但是，当前方法主要基于卷积神经网络，无法正确探索全局信息，因此通常会导致不完整的对象区域。在本文中，为了解决上述问题，我们介绍了自然整合全局信息的变形金刚，以生成更具不可或缺的初始伪标签，以用于端到端WSSS。由变压器中的自我注意力与语义亲和力之间的固有一致性激发，我们提出了来自注意力（AFA）模块的亲和力，以从变形金刚中的多头自我注意力（MHSA）学习语义亲和力。然后将学习的亲和力借用以完善初始伪标签以进行分割。此外，为了有效地得出可靠的亲和力标签，用于监督AFA并确保伪标签的局部一致性，我们设计了一个像素自适应改进模块，该模块结合了低级图像外观信息，以完善伪标签。我们进行了广泛的实验，我们的方法在Pascal VOC 2012和MS Coco 2014数据集中获得了66.0％和38.9％的MIOU，大大优于最近的端到端方法和几个多阶段竞争对手。代码可在https://github.com/rulixiang/afa上找到。

translated by 谷歌翻译